Introdução

Descritiva

Neste seção temos a uma descrição dos dados, que poderá ser melhor visualizado na Tabela 1. No caso, nosso variável de interesse é trsgi, que apresenta mínimo de 0.4 e máximo de 1.94 aproximadamente. Série completa apresenta 1534 observações, das quais 1552 foram usadas como série de treino e 12 para série de teste. Desca-se que a frequência utilizada foi de 12 meses (h=12).

Tabela1: Valores descritivos dos dados
age_CE trsgi numsamp
Min. : 441.0 Min. :0.4000 Min. : 1.00
1st Qu.: 824.2 1st Qu.:0.8305 1st Qu.: 3.00
Median :1207.5 Median :0.9860 Median : 9.00
Mean :1207.5 Mean :1.0000 Mean :14.17
3rd Qu.:1590.8 3rd Qu.:1.1470 3rd Qu.:26.00
Max. :1974.0 Max. :1.9420 Max. :39.00

Temos abaixo a série e o histograma da mesma. Pelo histograma, podemos notar que a série parece possuir certa normalidade com uma leve cauda à direita, porém o teste de Shapiro-Wilk indicou um p-valor menor que 0.05.

Série Análisada

Série Análisada

Série Análisada

Série Análisada

As Tabelas 2, 3 e 4, apresentam os resultados dos testes de raiz unitária, tendência determinística e sazonalidade. Por conseguite, a série não apresentou nenhuma destas características.

Tabela 2: Resultados testes de raiz unitária
Testes H0 p_valor Conclusao
Augmented Dickey-Fuller Tendencia 0.01 NAO tendencia
Phillips-Perron Unit Root Tendencia 0.01 NAO tendencia
KPSS Test for Level NAO tendencia 0.10 NAO tendencia
Tabela 3: Resultados teste de tendência determinística
Testes H0 p_valor Conclusao
Cox Stuart NAO tendencia 0.6911 NAO tendencia
Cox and Stuart Trend NAO tendencia 0.6371 NAO tendencia
Mann-Kendall Trend NAO tendencia 0.2007 NAO tendencia
Mann-Kendall NAO tendencia 0.2007 NAO tendencia
KPSS Test for Trend NAO tendencia 0.1000 NAO tendencia
Tabela 4: Resultados teste de sazonalidade
Testes H0 p_valor Conclusao
Kruskall Wallis NAO Sazonal 0.8854 NAO Sazonal
Friedman rank NAO Sazonal 0.8896 NAO Sazonal

Ajuste dos modelos

Ao todo foram criados dois modelos, um apenas com médias móveis e um outro modelos apenas com a estrutura autorregressiva.

Modelo 1

O primeiro modelo é do tipo AR(3) com \(\text{AIC}=-962.9\) e \(\text{BIC}=-936.26\).

A Tabela 5, apresenta os resultados das métricas do modelo 1. No conjunto de treinamento, o Erro Médio (ME) foi de 0.0002, indicando que o modelo não apresenta viés sistemático, ou seja, não tende a subestimar ou superestimar as previsões de forma consistente. Por outro lado, no conjunto de teste, o ME foi de -0.0598, sugerindo uma leve tendência do modelo a superestimar os valores reais quando aplicado a dados não vistos. Quanto à Raiz do Erro Quadrático Médio (RMSE), observou-se um valor de 0.1757 no treinamento e 0.1184 no teste, o Erro Percentual Absoluto Médio (MAPE) foi de 14.46% no treinamento e 13.10% no teste, indicando que, em média, as previsões do modelo apresentam um desvio percentual em torno de 14% nos dados de treino e 13% nos dados de teste. Em síntese, o modelo demonstrou um bom desempenho preditivo, com métricas consistentes e até mesmo melhores no conjunto de teste em comparação ao treinamento.

Tabela 5: Métricas de ajuste do modelo 1
ME RMSE MAE MAPE
Training set 0.0002 0.1757 0.1329 14.4641
Test set -0.0598 0.1184 0.1047 13.1075
 coeftest(mod1.1)
## 
## z test of coefficients:
## 
##           Estimate Std. Error z value  Pr(>|z|)    
## ar1       0.519065   0.025457 20.3896 < 2.2e-16 ***
## ar2       0.117253   0.028598  4.1001 4.130e-05 ***
## ar3       0.117388   0.025486  4.6059 4.106e-06 ***
## intercept 0.999861   0.018237 54.8267 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

A seguir, são apresentados os resultados da análise dos resíduos. Em que os resíduos não apresentam autocorrelação pelo teste de Ljung-Box, indicando que o modelo foi razoável no ajuste.

## 
##  Ljung-Box test
## 
## data:  Residuals
## Q* = 32.318, df = 24, p-value = 0.1193
## 
## Model df: 0.   Total lags used: 24

Por fim, o gráfico abaixo é um demonstração da série real, os valores ajustado e os valores previstos.

Modelo 2

O segundo modelo criado, paresenta apenas estuturas de médias móveis MA(10), com \(\text{AIC}=-962.66\) e \(\text{BIC}=-898.72\).

coeftest(mod1.2)
## 
## z test of coefficients:
## 
##           Estimate Std. Error z value  Pr(>|z|)    
## ma1       0.510781   0.025535 20.0032 < 2.2e-16 ***
## ma2       0.380012   0.028548 13.3114 < 2.2e-16 ***
## ma3       0.356115   0.029747 11.9713 < 2.2e-16 ***
## ma4       0.336264   0.030410 11.0576 < 2.2e-16 ***
## ma5       0.227622   0.030957  7.3529 1.939e-13 ***
## ma6       0.193580   0.031577  6.1304 8.764e-10 ***
## ma7       0.194425   0.030655  6.3423 2.263e-10 ***
## ma8       0.150404   0.030533  4.9259 8.397e-07 ***
## ma9       0.138065   0.027341  5.0498 4.423e-07 ***
## ma10      0.078911   0.025649  3.0766  0.002094 ** 
## intercept 1.000289   0.015960 62.6732 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

A Tabela 6, apresenta o resultados das métricas que avaliam a qualidade do ajuste do modelo em questão. No conjunto de treinamento, o modelo apresentou um Erro Médio (ME) de 0.0002, demonstrando equilíbrio nas previsões, sem tendência sistemática de sub ou superestimação. Contudo, no conjunto de teste, observou-se um ME de -0.0880, indicando o surgimento de um viés negativo quando aplicado a dados não vistos. Quanto à precisão das previsões, o modelo apresentou RMSE de 0.1749 no treinamento e 0.1487 no teste. Por último, a análise do MAPE revelou valores de 14.4428% e 16.7124% para treinamento e teste, respectivamente. Esta diferença de aproximadamente 2.27 pontos percentuais indica um desempenho ligeiramente inferior em dados não vistos, ainda que dentro de uma margem considerada aceitável para muitas aplicações práticas.

Tabela 6: Métricas de ajuste do modelo 2
ME RMSE MAE MAPE
Training set 0.0002 0.1749 0.1327 14.4428
Test set -0.0880 0.1487 0.1336 16.7124

A seguir, temos a análise de resíduos do modelo, em que pelo teste de Ljung-Box os resíduos não apresentam autocorrelção, indicando um bom ajueste do modelo.

## 
##  Ljung-Box test
## 
## data:  Residuals
## Q* = 18.12, df = 24, p-value = 0.7971
## 
## Model df: 0.   Total lags used: 24

Por fim, o gráfico abaixo é um demonstração da série real, os valores ajustado e os valores previstos.